在這一輪生成式 AI 的進化中,一個矛盾開始變得越來越明顯。
模型變得更聰明,但使用它的代價也變得更難忽視。
Claude Fable 5 被許多開發者視為新一代高階模型的代表,它在推理能力、程式設計、複雜任務拆解上展現出明顯優勢。但同時,它也帶來一個現實問題:成本急遽上升。
在某些實際使用案例中,高階模型的 token 消耗甚至遠高於上一代模型。原因並不只是價格,而是「推理行為本身變得更長、更深、更複雜」。
在使用的過程中,可以發現,AI 越會思考,它就越昂貴。
筆者透過 AIMochi 筆記工具,整理多方公開資訊和最新報導內容,來探討這並不僅是單純的價格問題,更是「推理結構成本」的問題。
在多數 AI 系統演進中,通常會出現一個規律:
小模型:便宜但能力有限
中模型:均衡
大模型:能力強但成本高
但 Claude Fable 5 的出現,讓這個平衡開始失效。
它不只「更準確」,而是:
更會拆解問題
更傾向自我反思
更容易進入多輪推理循環
這導致一個現象:同樣任務,它會「做更多思考步驟」
而在 token 計費機制下:思考步驟 = 成本
因此出現了新的問題:即使輸出結果更好,但總成本卻顯著上升。
這也讓許多開發者開始重新思考:我們真的需要「全程最強模型」嗎?
在這樣的背景下,一種混合式架構開始被提出,稱為「10/80/10 系統」。
這不是一個官方標準,而是一種工程實務上的分工思想。
其核心邏輯是:把 AI 任務拆成三段
① 10%:規劃(Planning)
使用最強模型(如 Fable)
架構設計
任務拆解
策略生成
重點:只做「思考」,不做執行
② 80%:執行(Execution)
使用中低成本模型(如 Haiku 或輕量模型)
程式碼生成
內容填充
重複性任務
重點:大量輸出,但不深度推理
③ 10%:審查(Review)
再次使用高階模型
錯誤檢查
邏輯驗證
最終修正
重點:品質控制,而非生成
這個結構的本質並非為了省錢,更是:把「思考」與「執行」從同一個模型中拆開。
很多人誤以為成本來自模型單價,但實際上更大的問題是:AI 代理的「循環行為」
當模型開始具備:
自我修正
多輪推理
反覆驗證
它就會進入一種狀態:不斷生成 → 檢查 → 再生成 → 再修正
這在工程上被稱為「agent loop」。
而成本問題也在這裡爆發。
因為:
每一輪都是 token
每一次修正都是計費
每一個驗證步驟都是額外推理
結果就是:一個看似簡單的任務,可能被放大成數十倍 token 消耗。
這也是為什麼開發者開始強調:必須限制 AI 的「思考深度」,而不是無限放大它。
過去 AI 使用方式是:提問 → 得到答案
但在 Fable 5 這一代模型中,這種方式開始失效。
原因是:
單次回答不再足夠
系統傾向建立結構化解法
模型會自行延展任務
因此新的方式變成:設計系統,而不是寫提示詞
也就是:
目標(Goal)
約束(Constraint)
檢查點(Checkpoint)
循環(Loop)
AI 不再只是工具,而是「半自主工作系統」。
此外,更進一步的發展,是「循環式 AI 系統」。
這類系統具備:
自動執行任務
定期回顧結果
根據結果修正策略
再次執行
它的運作方式接近:一個永遠不停止的工作代理人
但問題是:
每一輪都在消耗 token
每一輪都可能產生冗餘思考
沒有良好限制會導致成本失控
因此未來 AI 工程的關鍵不再只是「讓 AI 更強」,而是:
如何讓 AI 在有限成本下保持足夠智能
隨著模型能力提升,一個新的產業分層正在形成:
第一層:個人用戶
使用限制明顯
成本敏感
第二層:中小企業
開始導入工作流
但缺乏成本治理能力
第三層:大型企業
可以設計完整 AI 系統
擁有 token 優化能力
這意味著:AI 不只是技術競爭,而是成本治理能力競爭。
Claude Fable 5 代表的是一個清楚訊號:AI 已經不再只是「誰比較強」,而是:
誰能用最低成本完成最高品質的推理。
在這個新階段中,最重要的能力不再是 prompt engineering,而是:
任務拆解能力
系統設計能力
成本控制能力
agent workflow 設計能力
當 AI 開始進入「循環自動化」與「多模型協作」時,真正的競爭才剛開始。
而這場競爭的核心,除了模型本身,更是:我們如何使用模型。
以上僅供參考與資訊分享之用!若想快速了解更多資訊,透過 AIMochi 台灣本土筆記工具,幫我們從海量資料中,梳理出關鍵資訊,讓我們精準掌握重要訊息!